home *** CD-ROM | disk | FTP | other *** search
/ Columbia Kermit / kermit.zip / newsgroups / misc.19980901-19981211 / 000387_news@newsmaster….columbia.edu _Thu Dec 3 10:30:36 1998.msg < prev    next >
Internet Message Format  |  2020-01-01  |  6KB

  1. Return-Path: <news@newsmaster.cc.columbia.edu>
  2. Received: from newsmaster.cc.columbia.edu (newsmaster.cc.columbia.edu [128.59.35.30])
  3.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id KAA29359
  4.     for <kermit.misc@watsun.cc.columbia.edu>; Thu, 3 Dec 1998 10:30:36 -0500 (EST)
  5. Received: (from news@localhost)
  6.     by newsmaster.cc.columbia.edu (8.8.5/8.8.5) id KAA28907
  7.     for kermit.misc@watsun; Thu, 3 Dec 1998 10:30:36 -0500 (EST)
  8. Path: news.columbia.edu!watsun.cc.columbia.edu!fdc
  9. From: fdc@watsun.cc.columbia.edu (Frank da Cruz)
  10. Newsgroups: comp.protocols.kermit.misc
  11. Subject: Finnish character set
  12. Date: 3 Dec 1998 15:30:34 GMT
  13. Organization: Columbia University
  14. Lines: 102
  15. Message-ID: <746aqq$s98$1@apakabar.cc.columbia.edu>
  16. NNTP-Posting-Host: watsun.cc.columbia.edu
  17. Xref: news.columbia.edu comp.protocols.kermit.misc:9594
  18.  
  19.  
  20. > Erkki Eerola wrote:
  21. > > -----Original Message-----
  22. > > From: Frank da Cruz [mailto:fdc@watsun.cc.columbia.edu]
  23. > > > >What application do you have that does not use any of Kermit 95's
  24. > > > >built-in character sets?
  25. > > >
  26. > > > I need a character set which has the scandinavian characters 
  27. > > > and the same time the "backspace"-character "^".
  28. > That was a typing error, Erkki meant "up-arrow"
  29. > > What is the code of this character, and what do you expect it to do when it
  30. > > is sent to the terminal screen?
  31. > Up-arrow is decimal 94 and we would like to have it coming from key scancode
  32. > \954 (the key below backspace, left of return. On finnish keyboard it has 
  33. > up-arrow, umlaut and tilde stamped on top of it). Old kermit produced up-
  34. > arrow from that key by pressing shift-^-space, like MSDOS/Winxx pc's usually
  35. > do. Win95-kermit beeps and a "?" appears.
  36. > I tried "set terminal character-set german" and then "^" worked fine (only
  37. > the swedish circumlex-a was missing). In Finland we need that character too.
  38. > If we put character code \94 "^" to whatever key, result is same, in finnish
  39. > character set it always comes out with a beep and "?". To me it seems that
  40. > kermit-95 doesn't know what to do with character 94 in finnish character set.
  41. > In good old times it was handled just like in us-ascii, with no conversion.
  42. >     greetings,
  43. >             Esa Aarnio, host/netmaster@utu.fi
  44. > ps. Thank you for kermit, it has been a great terminal emulator and it is
  45. > still used a lot here !
  46. Thanks for saying so.
  47.  
  48. The situation with the 7-bit Finnish character set is somewhat confusing.
  49.  
  50. First of all, let us note that, in the ISO International Register of Coded
  51. Characters Sets, there is a set called "NATS, Primary Set for Finland and
  52. Sweden" (accompanied by a secondary set), ISO Registration Numbers 8-1 and
  53. 8-2, from the Scandinavian Newspaper Technical Cooperation Council.
  54.  
  55. These are the only 7-bit character sets for Finnish listed in the Registry.
  56. These are not general-purpose character sets; they are only for use by
  57. newspapers, and Kermit does not support them (nor has anybody ever suggested
  58. that Kermit should support them).  They contain such characters as "Unit
  59. Space A", "Unit Space B", "Solid" (slug), and "Short Dash", in place of the
  60. letters and punctuation that most users prefer to have.
  61.  
  62. The 7-bit character-set that most people think of when they say "Finnish",
  63. and the on used by all versions of Kermit when told to "set terminal (or
  64. file) character-set finnish", is the Finnish National Replacement
  65. Character-Set (NRC) used by the DEC VT220 and later terminals, which is
  66. listed in the manuals for these terminals, and in "Using C-Kermit", 2nd
  67. Edition, page 559.  In this set, the character in Column 5 / Row 14 (decimal
  68. 94) is Capital Letter U with Diaeresis (Umlaut).
  69.  
  70. When you say "up-arrow", you mean circumflex, right?  This is, indeed, the
  71. character that is replaced by U-Diaeresis in this character-set.
  72.  
  73. Of course, this is the disadvantage of 7-bit national replacement character
  74. sets: they replace characters from ASCII such as brackets, braces,
  75. backslash, vertical bar, and sometimes also number-sign, at-sign,
  76. circumflex, underscore, and accent grave, and sometimes people do not like
  77. to give up certain of these characters, as in your case, the circumflex.
  78.  
  79. This is why the 8-bit ISO Latin Alphabets were developed.  (Of course these
  80. have limitations of their own, and that is why Unicode and ISO 10646 were
  81. developed).
  82.  
  83. When Kermit 95 was released, some people were upset that it did not include
  84. the "set translate input" feature from MS-DOS Kermit.  This was a deliberate
  85. decision, since Kermit 95 fully implements ISO 2022 character-set
  86. designation and invocation, which allows many character sets to be used on
  87. the same screen.  Since the host can switch the terminal among four (or more
  88. character sets) on a per-character basis, the "set translate input" command
  89. (which assumes there is only *one* character set) has no meaning in this
  90. context.
  91.  
  92. The real problem is that MS-DOS Kermit's "set translate input" command
  93. enabled (and encouraged) the creation of new, ad-hoc, nonstandard character
  94. sets, to be used in lieu of standard character sets and proper ISO 2022
  95. rules, e.g. for mixing accented letters and box-drawing characters.  This is
  96. why it was such a bad mistake, and why it is so important not to repeat it.
  97.  
  98. MS-DOS Kermit and Kermit 95 both support a wide range of standard (and
  99. corporate) terminal character sets that are also supported by real
  100. terminals, plus the standards to mix them on the same screen.
  101.  
  102. It appears to me that your application is using a nonstandard character set,
  103. and should be modified to use the regular Finnish NRC or, better, an 8-bit
  104. ISO Latin Alphabet, in which you do not have to choose between accented
  105. letters and brackets, braces, and circumflex.
  106.  
  107. However, it is possible that there is some Finnish or corporate standard I
  108. do not know about, which defines the character set you are using.  In that
  109. case, please let me know what it is.
  110.  
  111. - Frank